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Resumen 


Los registros de gastos máximos anuales (crecientes) permiten el dimensionamien- 
to hidrológico de las obras hidráulicas de protección y de cruce. Lógicamente, 
entre mayores sean las series disponibles, más confiables serán sus estimaciones 
probabilísticas o predicciones. Por tal razón, en este trabajo se describe con detalle 
la técnica de transferencia de información de crecientes, mediante regresión lineal 
múltiple, para ampliar registros cortos con base en las series largas cercanas, 
revisando la conveniencia estadística de dicha transferencia. Se expone la 
formulación matemática de manera simple, al utilizar la solución matricial y se 
desarrolla un ejemplo numérico para ampliar la serie de la estación hidrométrica 
Platón Sánchez del río Tempoal en el estado de Veracruz, México, utilizando 
diversos registros cercanos. Por último, se formulan las conclusiones, las cuales 
destacan la sencillez del procedimiento y sugieren su aplicación sistemática. 
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Introducción 


La planeación, diseño y manejo de los pro- 
yectos de recursos hidráulicos se basa en los 
registros históricos climáticos e hidrológicos, 
tales como precipitaciones, evaporaciones, escu- 
rrimientos líquidos y sólidos, y crecientes. 
Desafortunadamente, los registros históricos 
son comúnmente de corta extensión y por ello 
pueden fallar en proporcionar una estimación 
confiable de la variabilidad del fenómeno 
hidrológico estudiado (Salas et al., 2008). 

Por lo anterior, resulta importante buscar 
fuentes de datos adicionales y técnicas de 
extensión de los registros que permitan obtener 
series más largas. Las fuentes comunes de 
información para ampliar registros cortos son 
otros registros largos cercanos, o bien series 
amplias de precipitación disponibles dentro de 
la zona estudiada. Respecto a los procedimien- 


tos desarrollados para extender registros 


cortos, la mayoría son estadísticos basados en 
la correlación que puede existir entre las series 
utilizadas; presentando dos objetivos al realizar 
la extensión, uno busca mejorar la estimación de 
los parámetros poblacionales (media y varian- 
cia) del registro corto y el otro intenta mantener 
O preservar sus estimaciones (Salas et al., 2008). 

Tomando en cuenta que comúnmente los 
registros cortos conducen a estimaciones ine- 
xactas de los parámetros poblacionales, el 
propósito de toda extensión de un registro 
consiste en mejorar la confiabilidad de sus 
estimaciones, a través de reducir su variabilidad 
(Gilroy, 1970); ya que una estimación 0, de un 
parámetro estadístico O se dice que es más 
confiable que otra 6, de 0, si E(9) = 0, coni=1, 2 
y Var(0;) < Var(0,). 

El objetivo de este trabajo consiste en ex- 
poner con detalle la técnica de transferencia 
de información de crecientes (gastos máximos 
anuales), mediante regresión lineal múltiple, 
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para ampliar registros cortos con base en las 
series largas cercanas, revisando la convenien- 
cia estadística de dicha transferencia. Se 
presenta la formulación matemática de mane- 
ra simple al utilizar la solución matricial y se 
desarrolla un ejemplo numérico en la cuenca 
del río Tempoal, de la Región Hidrológica 26 
(Pánuco), de México, para ampliar el registro 
de la estación hidrométrica Platón Sánchez, 
empleando diversos registros cercanos de tal 
cuenca. 


Desarrollo 
Modelo matemático 


La regresión lineal múltiple es aplicada para 
transferir información de gastos máximos 
anuales (crecientes) a una localidad con registro 
corto, cuando existen dos o más sitios cercanos 
que tienen registros largos. Considerando que 
la serie corta tiene una extensión de n, años, 
es representada por la variable dependiente 
y y se tienen p registros de tamaño n, + n, 
representados por el vector x; es decir, que se 
tiene el siguiente arreglo: 


Yi VYoar Y y, 
a AS 1 1 1 

AS ar 1+M) 
2 Z 2 2 2 

X1 oK ar mp 
ES LA LES LA 

x ,X> , Xi +1 A ¡Ho 


en el cual, las observaciones en los dife- 
rentes instantes o puntos en el tiempo son 
independientes. Además, como es lo usual 
en estadística, se acepta que todos los 
gastos proceden de una población Normal 
multivariada, o bien que ellos pueden ser 
transformados para seguir tal distribución, con 
parámetros: H,, 4, 0%, 07 y R, en donde 1, y 07 
son los valores poblacionales de la media y la 
variancia de x', respectivamente, para ¡=1,2,..., 
p; 1, y O; son las magnitudes poblacionales de 


la media y variancia de y, y R es el coeficiente 


de correlación múltiple poblacional (Gilroy, 
1970; Salas, 1993). 

Entonces, para transferir información de 
crecientes desde las p estaciones hidrométricas 
con registros de tamaño n, + n, al sitio con la 
serie corta y, y además mejorar las estimacio- 
nes de sus parámetros 1, y O;, se usa el siguiente 
modelo de regresión múltiple que relaciona a 
y, con los p registros de Xx, (Gilroy, 1970; Salas, 
1993): 


1 


(1) 


AN B AN 4 
D,=by+ Y bx, 
=1 
q (1-£3)%a 0, (1)12-e, 


para el cual, la constante 6, y los coeficientes 
6, se obtienen mediante el arreglo matricial 
siguiente (Campos-Aranda, 2003): 


Y, 
b mm ió 
5 y Y, 
1 t=1 
a b =| A (2) 
? y Y, 
Ñ El. 
b, 
Y x Y, 
t=1 
es decir: 


Xb=Y £ b=X"-Y (3) 


Las otras variables de la ecuación (1) 
asociadas con el término de ruido son (Salas, 
1980): 
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2 1/2 
OS | (4) 


s(y) 


ya definido como el coeficiente de correlación 
múltiple, siendo s¡(y) la dispersión de la 
variable dependiente y Se? es la suma de los 
cuadrados de los residuos, es decir (Campos- 
Aranda, 2003): 


m 


1 e 
5 (y)= ==) (y) (5) 
Ma 
con: 
1 m 
a 6 
Y me Y (6) 
1 m ] 
Se? = A a 9, (7) 


El factor a. es el requerido para obtener una 
estimación insesgada de O, su expresión es 
(Salas, 1980): 


119 (01, -2p Dn, AS 1) 


a, De -p-DM-=p-D 


1/2 
| (8) 


El factor € es igual a la unidad si el término 
de ruido es considerado, de otra manera es cero; 
caso común cuando se transfiere información 
de crecientes. Finalmente, e, es una variable 
Normal con media cero y variancia unitaria 


(Salas, 1980, 1993). 


Criterios para mejorar los parámetros 


Al aplicar la ecuación (1) para extender el 
registro corto y, se obtiene la secuencia: 


Yi Va Var Y UY ir ar Y ma 


a partir de la cual se obtienen la nueva media y 
la variancia [y, s(y)]. Estos nuevos parámetros 


tendrán menor variancia y por lo tanto serán 
mejores estimaciones muestrales de los valores 
poblacionales si el coeficiente de correlación 
múltiple (R) excede ciertos límites. Para la 
media, su valor crítico está dado por (Gilroy, 
1970; Salas, 1980, 1993): 


(9) 


en las columnas (1) del cuadro 1 se muestran 
los valores críticos de R para diversas magnitu- 
des de n, y de p. Para la variancia, el valor crítico 
de R tiene una expresión que es función de 1, 
1,, 9 y p (Gilroy, 1970; Moran, 1974; Salas, 1993). 
Sin embargo, cuando 6 = 0, prácticamente no 
varía con 1,, por ello en las columnas (2) del 
cuadro 1 se presentan sus valores críticos para 
n,= 60. 


Descripción del sistema de río Tempoal 


Al río Tempoal lo forman los ríos Hules y 
Calabozo, cuyas cuencas de drenaje inician en la 
frontera del bajo Pánuco (Región Hidrológica 26 
Parcial), en los estados de Hidalgo y Veracruz; 
están aforados por las estaciones hidrométri- 
cas Los Hules y Terrerillos, respectivamente. El 
río Tempoal tiene un recorrido de sur a norte 
y es uno de los colectores más importantes 
del río Moctezuma, al que se le une por la 
margen derecha en el poblado de El Higo, 
Veracruz. Antes de la estación hidrométrica 
Tempoal, última del sistema, le llega por 
margen izquierda el río San Pedro, aforado en 
la estación El Cardón. Finalmente, cerca del 
poblado de Platón Sánchez, en Veracruz, está 
la estación hidrométrica del mismo nombre 
sobre el río Tempoal. En la figura 1 se muestra 
la ubicación del sistema del río Tempoal. 


Información hidrométrica disponible y 
su procesamiento 


Las áreas de cuenca de las cinco estaciones 
de aforos citadas: El Cardón, Los Hules, 
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Cuadro 1. Valores críticos del coeficiente de correlación múltiple (R) para mejorar las estimaciones de media (1) 


y variancia (2). 


pi p=2 p=3 p=4 p=5 

ió (1) (2) (1) (2) (1) (2) (1) (2) (1) (2) 

10 0.354 0.650 0.500 0.763 0.612 0.841 0.707 0.899 0.791 0.945 
12 0.316 0.597 0.447 0.707 0.548 0.785 0.632 0.845 0.707 0.892 
14 0.289 0.556 0.408 0.661 0.500 0.739 0.577 0.799 0.645 0.847 
16 0.267 0.522 0.380 0.624 0.463 0.700 0.535 0.759 0.598 0.808 
18 0.250 0.494 0.354 0.592 0.433 0.666 0.500 0.725 0.559 0.774 
20 0.236 0.469 0.333 0.565 0.408 0.637 0.471 0.695 0.527 0.744 
25 0.209 0.422 0.295 0.510 0.361 0.578 0.417 0.634 0.466 0.681 
30 0.189 0.386 0.267 0.469 0.327 0.533 0.378 0.587 0.423 0.632 
35 0.174 0.359 0.246 0.436 0.302 0.498 0.348 0.548 0.389 0.592 
40 0.162 0.336 0.229 0.410 0.281 0.468 0.324 0.517 0.363 0.559 
45 0.152 0.317 0.216 0.387 0.264 0.443 0.305 0.490 0.341 0.531 
50 0.144 0.301 0.204 0.368 0.250 0.422 0.289 0.467 0.323 0.506 
55 0.137 0.288 0.194 0.352 0.238 0.404 0.275 0.447 0.307 0.485 
60 0.131 0.276 0.186 0.338 0.227 0.387 0.263 0.429 0.294 0.466 

Terrerillos, Platón Sánchez y Tempoal son, Normal. Se aplicaron las ¡pruebas de 


respectivamente: 609, 1 269, 1 493, 4 700 y 5 275 
km”. El registro de gastos máximos anuales de 
la estación Tempoal comienza en 1954 y los 
del resto en 1960, teniendo disponibles tales 
series hasta 2002 en el sistema BANDAS (IMTA, 
2003). En el cuadro 2 se presenta la información 
que será procesada para completar el registro 
de la estación hidrométrica Platón Sánchez en 
el periodo de 1960 a 1977 (n, = 18 años). 

Respecto a los datos faltantes de las 
estaciones Los Hules (1990 y 1991) y Terrerillos 
(1981), se intentó deducirlos con base en 
una regresión entre ambos registros, pero el 
diagrama de dispersión indica que no existe tal 
relación. Los datos faltantes de la estación El 
Cardón (1998 y 2000) tampoco se pudieron ser 
estimados con cierta garantía. Por lo anterior, 
el periodo común (11,) queda definido en veinte 
años, en el periodo 1978 a 2002, con los cinco 
años citados excluidos. 

Todos los registros disponibles (cuadro 
2), tanto de su periodo completo como de 
1978 a 2002, se probaron para verificar su 
aleatoriedad, ausencia de componentes de- 
terminísticas y procedencia de una población 


persistencia, de Kendall, de von Neumann, de 
Cramer (Campos-Aranda, 1992) y de Shapiro- 
Wilk (Shapiro y Wilk, 1965; Ruiz-Maya, 1977). 
Todas las pruebas se realizaron con un nivel de 
significancia del 5% (95% de confiabilidad). 

Se encontró que todos los registros pre- 
sentan aleatoriedad, es decir son valores 
independientes, no presentan componentes 
determinísticas y no proceden de poblaciones 
Normales. Debido a esto último, las regre- 
siones que se analizan se realizaron con base 
en los valores logarítmicos de los datos, 
que es la situación común en los estudios de 
transferencia de información de crecientes. Se 
utilizaron logaritmos naturales. 


Regresiones lineales efectuadas 


Primeramente se realizaron cuatro regresiones 
lineales univariadas en el periodo 1978-2002 
entre Platón Sánchez y cada una de las otras 
cuatro estaciones hidrométricas, los coeficien- 
tes de correlación eN obtenidos fueron: con 
El Cardón 0.6761, con Los Hules 0.7881, con 
Terrerillos 0.8193 y con Tempoal 0.9556. Estos 
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Figura 1. Ubicación del sistema del río Tempoal, en la Región Hidrológica 26 Parcial (Bajo Río Pánuco). 
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Cuadro 2. Gastos máximos anuales (m?/s) en las estaciones hidrométricas de la cuenca del río Tempoal en el 


periodo común de 1960 a 2002. 


Núm Año El Cardón Los Hules Terrerillos P. Sánchez Tempoal 
il 1960 1 080.0 452.6 314.0 - 1277.0 
2 1961 303.5 434.5 525.0 - 852.9 
3 1962 262.0 457.5 565.9 - 739.2 
4 1963 481.0 947.4 895.9 = 1 800.0 
5 1964 188.6 258.0 397.1 - 748.0 
6 1965 338.0 414.9 659.4 - EI 
7 1966 287.0 742.2 1 121.7 - 1778.0 
8 1967 854.2 1 009.4 1 153.0 - 2 245.0 
9 1968 476.0 1 096.0 611.2 - 1 145.0 

10 1969 555.8 825.0 2 224.2 - 1 948.0 
11 1970 560.0 800.0 1 420.0 - 1 418.0 
17 197 720.4 1 064.0 1 488.5 - 1 630.0 
13 1972 320.0 1 110.0 529.0 - 989.0 
14 1973 392.0 749.0 1740.0 - 1 668.0 
15 1974 1 198.3 1 950.0 3 187.8 - 4 950.0 
16 1975 1 204.2 2 470.0 2 085.0 - 4 040.0 
17 1976 419.7 937.7 1 000.5 - 1 275.0 
18 1977 179.1 559.0 291.2 - 514.0 
19 1978 1 390.0 2 874.0 2 152.3 2 898.0 3725.0 
20 1979 667.0 1 082.0 659.1 1 040.0 1 655.9 
21 1980 357.0 583.2 994.1 976.0 1162.0 
20 1981 765.2 1 650.3 = 1 940.0 2 020.0 
23 1982 182.3 340.0 491.4 589.8 539.6 
24 1983 269.8 544.0 768.4 827.3 868.0 
25 1984 572.0 2 834.9 2 981.0 4 530.0 4 030.0 
26 1985 457.0 938.4 1 487.7 1 608.0 1 882.0 
27 1986 192.0 308.0 434.0 462.0 476.0 
28 1987 346.8 1 440.0 2 635.0 1310 1765.0 
29 1988 356.0 4 350.0 3710.0 3 653.0 3 265.0 
30 1989 306.0 644.0 2 100.0 653.0 649.0 
31 1990 306.0 - 702.0 4 115.0 1 611.0 
32 go 1 248.0 - 2 860.0 1916.0 3532.0 
33 1992 790.0 762.8 1 607.5 1 494.9 2 291.0 
34 1993 865.5 1 684.1 34225 4 380.0 6120.0 
35 1994 412.0 723.8 12879 1 153.8 1 133.0 
36 1995 412.2 568.0 531.0 537.0 741.9 
37 1996 218.0 804.0 507.6 758.0 683.0 
38 1997 348.2 428.4 362.5 AOS 905.0 
39 1998 = 260.9 1 605.9 12598 1266.9 
40 1999 602.9 630.9 3 328.3 2.776.6 2 693.7 
41 2000 > 84.9 753.4 580.4 641.2 
42 2001 498.3 278.5 1512.2 1 201.3 1 847.9 
43 2002 134.0 496.7 822.2 774.8 926.4 


Nota: los años y datos sombreados no fueron utilizados. 
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resultados son consistentes, ya que las cre- 
cientes que mide la estación El Cardón (EC) 
no tienen relación con las de Platón Sánchez 
(PS); por el contrario, la estación Tempoal 
(TP) está aguas abajo, de cuya área de cuenca 
la estación con registro corto afora el 89.1%. 
En el cuadro 3 se presentan las estimaciones 
de gasto máximo anual en PS con esta última 
estación, cuya ecuación de regresión resultó: 
PS = 0.4899 +0.9186 - TP (10) 
Las siguientes regresiones probadas y sus 
coeficientes de correlación múltiple fueron: 
(1) Terrerillos (TR) y Tempoal con PS, ob- 
teniéndose 0.9583, y (2) Los Hules (LH) y 
Tempoal con PS, conduciendo a 0.9626, con la 
expresión siguiente: 


PS =0.3171+0.1605-LH +0.7944-TP. (11) 


En el cuadro 3 se tienen las estimaciones 
de gasto máximo anual en PS con la ecuación 
(11). 

Finalmente se realizaron otras dos re- 
gresiones múltiples, la primera con tres esta- 
ciones auxiliares y la segunda con las cuatro. 
Los resultados fueron: 


PS = 0.2543 +0.1472 - LH +0.0842 -TR 


(12) 
+0.7330 -TP 


PS=0.6162 —0.2092 - EC +0.1325 - LH 


+ 0.0449 - TR +0.9076 -TP da 


cuyos coeficientes R son 0.9640 y 0.9693, res- 
pectivamente. Nuevamente en el cuadro 3 se 
exponen las ampliaciones de registro en PS con 
estos dos modelos de regresión. 


Análisis de los resultados 
La estación hidrométrica Tempoal, por su 


ubicación aguas abajo de la estación Platón 
Sánchez, es una opción muy conveniente para 


realizar la transferencia de información, como 
lo demuestra su coeficiente de correlación kede 
con un valor de 0.9556, el cual es muy superior 
a los mínimos requeridos para mejorar la 
estimación de la media y la variancia, que son 
0.236 y 0.469, respectivamente, según el cua- 
dro 1. 

Conforme se utiliza más información de las 
estaciones de aforos cercanas la transferencia 
mejora, como lo demuestra el valor cada vez 
mayor de R, hasta el máximo alcanzado de 
0.9693, obtenido al utilizar las cuatro estaciones 
auxiliares (ecuación (13)). Para este caso, los 
valores críticos de R son 0.471 y 0.695, mismos 
que son superados ampliamente, por lo cual es 
conveniente la transferencia de información. 

Por otra parte, con base en los resultados 
del cuadro 4 mostrados en sus columnas 3 y 
5, se concluye que los parámetros estadísticos 
de la estación de aforos Platón Sánchez se 


Cuadro 3. Resultados de la transferencia de información 
de crecientes en la estación hidrométrica Platón Sánchez 
en el periodo de 1960 a 1977 con los modelos de regresión 
indicados. 


Modelo de regresión: 


das Ec. (10) Ec. (11) Ec. (12) Ec. (13) 
1960 1164.6 1 075.4 973.8 824.1 
1961 803.8 UNOS AE) 758.4 
1962 704.8 697.7 686.5 693.9 
1963 159%.3 159.3 525 1 540.6 
1964 712.5 642.5 617.8 685.4 
1965 als 726.1 zio 696.7 
1966 1 578.4 1 514.4 1 485.9 1 660.0 
1967 ODO 1 914.8 1 848.8 1 702.8 
1968 1 053.5 1 136.5 1 083.0 1 026.3 
1969 1716.5 1 656.2 1709.4 1 642.4 
1970 1 282.2 1 280.6 1 298.3 1 199.8 
1971 1 457.3 1 497.4 1 505.5 1 344.2 
1972 920.9 1 013.7 962.8 971.7 
1973 1 488.4 1 441.6 1 473.3 1 498.6 
1974 4 042.9 3 988.6 3961.7 3713.2 
1975 3 354.7 SID25:3 3410.4 SAS 
1976 1162.9 1 207.2 1 193.7 1 163.4 
1977 504.8 DS) AS) 538.5 
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Cuadro 4. Parámetros estadísticos en la estación hidrométrica Platón Sánchez de su registro original 


y del ampliado con las cuatro estaciones de aforos cercanas (ecuación (13). 


Periodo de registro en años 
Parámetro estadístico: 
1978-2002 1978-2002 1960-2002 1960-2002 
Número de datos 20 25 38 43 
Media 1 665.2 1 724.6 1 528.6 1137840 
Coeficiente de variación 0.762 0.734 0.712 0.703 
Coeficiente de asimetría 291 L.177 1.539 1.431 
Coeficiente de Curtosis 3.843 3.476 4.649 4.245 
Coeficiente de correlación 
0.112 0.179 0.012 0.048 
serial de orden uno 
conservan con la transferencia, disminuyendo Recibido: 08/07 /09 
ligeramente la media y el coeficiente de va- Aprobado: 21/10/10 
riación, y aumentando sensiblemente los 
coeficientes de asimetría y curtosis. Además, Referencias 


se conserva la escasa persistencia negativa, es 
decir, que la serie extendida también muestra 
una secuencia de valores grandes seguidos 
por magnitudes reducidas. 


Conclusiones 


La transferencia de información de gastos 
máximos anuales mediante regresión lineal 
múltiple para ampliar un registro corto con 
base en las series largas cercanas es una 
técnica sencilla y su conveniencia estadística 
puede ser verificada fácilmente. El uso de 
esta técnica permite obtener registros con 
un periodo común, lo cual es necesario para 
aplicar ciertos procedimientos de los análisis 
regionales de estimación de crecientes. 

Además, el registro ampliado garantiza 
una mejor estimación de los parámetros es- 
tadísticos (media y variancia) poblacionales, 
lo cual conducirá a una mayor exactitud 
de los análisis probabilísticos orientados a 
obtener las predicciones o avenidas de diseño. 
Por lo anterior, se recomienda su aplicación 
sistemática antes de iniciar un análisis de 
frecuencia de crecientes, ya sea con métodos 
locales o regionales. 
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Abstract 


CAMPOS-ARANDA, D.F. Transfer of flood information through multiple linear regression. 
Water Technology and Sciences, formerly Hydraulic engineering in Mexico (in Spanish). 
Vol. II, No. 3, July-September, 2011, pp. 239-247. 


Maximum annual flow records (floods) are used for hydrologic dimensionality of hydraulic 
structures designed for protection and crossing. Logically, the longer the available series, the 
more reliable their probabilistic estimates or predictions. Thus, this work describes in detail the 
procedure for flood information transfer through multiple linear regression. Short records are 
enlarged based on longer nearby series, examining the statistical advantage of said transfer. 
The mathematical formulation is presented in a simple way using a matrix solution and 
a numerical example is developed to enlarge the series at the Platón Sánchez hydrometric 
station on the Tempoal River in the state of Veracruz, using several nearby records. Lastly, 
the conclusions are formulated, which point out the simplicity of the procedure and suggest its 
systematic application. 


Keywords: mean, variance, multiple correlation coefficient, randomness, Shapiro-Wilk test, 
Tempoal river. 
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